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摘 要 选取 奖赏 预测 误差 (reward prediction error, RPE) 效 价 和 凸显 性 为 自 变量 ， 通 过 3 个 实 
验 考察 RPE 对 项 目 和 联结 记忆 影响 的 差异 及 其 元 记忆 机 制 。 被 试 在 对 图 片 的 奖赏 猜测 - 奖 


赏 反馈 中 形成 RPE， 且 需要 同时 记忆 图 片 (项目 ) 以 及 图 片 -奖赏 联 
Wo HRR, C) 联结 记忆 成 绩 存 在 RPE 正 效 价 和 低 凸 显 性 优势 


结 ， 最 后 进行 记忆 测 
， 其 信心 判断 准确 性 在 


RPE 正 效 价 时 更 高 ， 而 项 目 记忆 成 绩 存在 RPE 负 效 价 和 高 凸显 性 优势 ; 2) 在 编码 过 程 


注视 时 间 ， 缩 短 了 图 片 注 视 时 间 ; (3) 增加 RPE 水 平 后 ，RPE 对 项 


H, RPE 正 效 价 和 低 凸 显 性 提高 了 个 体 的 瞳孔 变化 均值 和 峰值 ，RPE 低 凸 显 性 增加 了 分 值 


目 和 联结 记忆 成 绩 的 分 


离 影 响 仍 稳定 存在 。 这 些 结果 表明 ，RPE 对 项 目 和 联结 记忆 的 影响 存在 分 离 ， 编 码 阶段 


H, 个体 以 RPE 效 价 和 凸显 性 为 线索 ， 通 过 元 记忆 控制 对 项 目 和 联 


结 记忆 加 工 中 的 认 知 资 


源 进行 差异 性 分 配 ， 提 取 阶 段 中 ，RPE 正 效 价 提高 了 对 联结 记忆 提取 的 元 记忆 监测 水 平 。 
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青 景 记忆 (episodic memory) 是 指 个 体 对 亲身 经 历 过 的 发 生 在 特定 时 间 和 地 点 的 事件 的 记 


忆 (Tulving, 2001)。 其 中 的 项 目 记 忆 (item memory) 是 对 情景 中 单个 项 目的 记忆 ， 而 联结 记忆 


(associative memory) 需 要 通过 绑 定 加 工 (binding) 将 多 个 项 目 或 特征 


进行 整合 (Murty et al., 


2016)。 在 日 常生 活 中 ， 认 知 资源 的 有 限 性 使 个 体 难 以 对 情景 中 的 全 部 信息 进行 加 工 ， 为 了 


研究 发 现 奖赏 结果 引起 了 个 体 对 项 目 和 联结 记忆 的 差异 性 加 


工 。Murty 等 (2016) 使 用 


使 此 刻 的 经 验 有 助 于 将 来 的 行动 ， 个 体 通常 会 在 编码 中 把 认 知 资源 分 配给 更 有 价值 的 信息 ， 
因此 同时 呈现 的 项 目 和 联结 记忆 信息 可 能 会 因 认 知 资源 竞争 被 差异 性 


加 工 。 


独裁 者 范式 ， 学 习 阶 段 的 每 个 试 次 中 ， 独 裁 者 拥有 $10， 可 以 分 配给 
其 中 某 个 独裁 者 所 分 本 


cu 
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自己 和 被 试 ， 告 知 被 试 


金额 将 被 付 现 ， 且 之 后 还 将 见 到 这 些 独 裁 者 面孔 。 为 获得 更 多 收益 ， 


家 自然 科学 基金 面 上 项 目 (32271095) 和 吉林 省 自然 科学 基金 面 上 项 目 ( 奖 党 预测 误差 对 记忆 的 影响 : 元 


被 试 在 学 习 阶 段 需 利 用 有 限 的 认 知 资源 ， 同 时 对 面孔 〈 项 目 ) 及 其 价值 信息 《项 目 -奖赏 联 
结 ) 进行 记忆 ， 能 够 体现 奖赏 如 何 影响 情景 中 的 不 同 记 忆 成 分 。 记 忆 测 试 的 结果 表明 ,在 独 
裁 者 事件 中 ， 项 目 记忆 受奖 赏 影响 不 显著 ， 但 低 奖赏 结果 促进 了 个 体 联 结 记 忆 的 提高 

另 有 研究 考察 了 奖赏 预测 误差 (reward prediction error, RPE) 对 项 目 记忆 和 联结 记忆 的 影 
响 (Ergo et al., 2021; Rouhani et al., 2018; Rouhani et al., 2020). RPE 是 奖赏 结果 减 去 奖赏 预期 
后 的 差 值 ， 有 效 价 和 凸显 性 两 个 属性 (Mason et al.,2019)。 效 价 (valance) 代 表 奖 赏 结果 高 于 还 
是 低 于 奖赏 预期 ， 正 效 价 代 表 奖 赏 结果 优 于 奖赏 预期 ， 负 效 价 代表 奖赏 结果 低 于 奖赏 预期 
(Ergo et al., 2020)。 凸 显 性 (salience) 代 表 奖 赏 结果 和 奖赏 预期 间 的 偏离 程度 ， 可 以 用 无 符号 
的 奖赏 预测 误差 ( unsigned RPE, URPE) 表示 ，URPE 越 大 代表 结果 与 预期 的 偏离 程度 越 大 ， 
个 体 的 意外 程度 越 高 (Rouhani et al., 2018). RPE 的 效 价 和 凸显 性 都 会 对 情景 记忆 产生 影响 。 

Rouhani 等 (2018) 在 学 习 阶段 让 被 试 对 图 片 进 行 奖赏 预期 并 获得 奖赏 反馈 结果 ， 习 得 图 
片 的 奖赏 规律 (其 中 一 类 图 片 出 现 高 奖赏 的 比率 更 大 )， 告 知 被 试 在 随后 的 决策 阶段 中 需 
在 每 两 张 图 片 中 进行 选择 并 获得 其 奖赏 ; 决策 阶段 后 对 被 试 进行 了 记忆 测试 。 以 反馈 结果 与 
奖赏 预期 之 差 作 为 RPE， 以 URPE 作为 RPE 凸显 性 ， 结 果 表 明 ，RPE 对 项 目 记忆 (图 片 再 
W) 影响 不 显著 ,但 URPE 显著 提高 了 项 目 记忆 成 绩 ， 说 明 项 目 记 忆 只 受到 了 RPE 凸显 性 
的 影响 。 之 后 Rouhani 等 (2020) 将 学 习 阶 段 换 成 被 动 的 顺序 奖赏 任务 ， 屏 幕 上 会 连续 呈现 知 
干 带 有 不 同 分 值 的 图 片 , 分 值 的 10% 被 累计 到 被 试 收益 中 , 由 分 值 分 布 的 变化 产生 RPE, 5 
然 发 现 了 项 目 记忆 的 RPE 高 凸显 性 优势 。 此 外 ， 该 研究 在 实验 4 中 让 被 试 对 图 片 呈现 时 序 
进行 记忆 ， 最 后 的 时 序 联结 记忆 成 绩 表 现 出 RPE 低 凸 显 性 优势 。 表 明 RPE 凸显 性 可 能 引起 
了 对 项 目 和 联结 记忆 的 差异 性 加 工 。 

但 在 上 述 研究 中 ， 只 有 项 目 记忆 能 影响 决策 收益 ， 因 此 在 编码 阶段 ， 被 试 将 以 RPE h 
显 性 为 线索 ， 对 图 片 编码 优先 投入 认 知 资源 ， 其 次 才 对 图 片 时 序 进行 学 习 ， 这 意味 着 联结 记 
忆 成 绩 可 能 主要 取决 于 项 目 记 忆 对 认 知 资源 的 占用 情况 ， 而 非 受到 RPE 的 直接 影响 。 不 同 
的 是 ， 一 些 研究 将 联结 记忆 作为 主要 任务 (外 语 -母语 词 对 联结 : Calderon et al., 2021; 人 物 - 
物品 联结 : Aberg et al.,2017)， 结 果 都 发 现 了 联结 记忆 中 的 RPE 正 效 价 优势 ， 却 并 未 能 验证 
RPE 凸显 性 的 影响 。Aberg 等 (2017) 虽 然 发 现 预 期 与 结果 偏差 更 小 CRPE 凸显 性 更 小 ) 的 条 
件 下 被 试 的 联结 记忆 成 绩 更 高 , 但 实验 中 该 条 件 下 得 到 正 性 结果 的 几率 也 更 大 RPE 效 价 更 
正 )， 因 此 难以 分 辨 出 联结 记忆 成 绩 的 提高 是 否 能 归 因 于 凸显 性 的 影响 。 

综 上 , 已 有 研究 发 现 奖赏 预测 误差 对 项 目 和 联结 记忆 的 影响 存在 差异 , 项 目 记忆 表现 出 


高 凸显 性 优势 , 联结 记忆 表现 出 正 效 价 优势 ,但 凸显 性 是 否 对 联结 记忆 存在 影响 还 有 待考 察 。 
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人 类 情景 中 通常 同时 涉及 项 目 和 联结 成 分 , 它们 需要 竞争 有 限 的 认 知 资源 , 奖赏 会 改变 个 体 


对 这 些 成 分 的 认 知 资源 投入 ， 因 而 项 目 和 联结 记忆 受奖 党 的 影响 表现 出 差异 性 (Murty et al ., 
2016)。 但 在 探究 RPE 对 情景 记忆 的 影响 时 ， 先 前 研究 对 项 目 和 联结 记忆 分 开 考察 ， 实 验 往 


往 只 包含 单一 记忆 任务 ， 难 以 探讨 RPE 对 项 目 和 联结 记忆 影响 的 差异 ， 更 无 法 进一步 揭示 
该 差异 产生 的 原因 一 一 即 RPE 对 认 知 资源 分 配 的 影响 。 因 此 本 研究 参考 Murty 等 (2016) 的 
研究 ， 以 图 片 和 图 片 - 奖 赏 联结 分 别 作为 项 目 和 联结 记忆 指标 ， 考 察 个 体 如何 基 于 RPE 同时 


进行 项 目 记 忆 和 联结 记忆 加 工 。 
记忆 编码 中 个 体 对 认 知 资源 投入 的 调节 , 是 元 记忆 控制 过 程 的 体现 , 为 揭示 奖赏 对 这 


过 程 的 影响 , 价值 导向 元 记忆 (value-directed metamemory) 研 究 中 采用 眼 动 技术 追踪 被 试 对 特 
定 兴趣 区 中 的 刺激 的 注视 时 间 Cfixation duration) 作为 学 习 时 间 分 配 (study-timeallocation) 

的 指标 , 发 现 高 价值 刺激 比 低 价值 刺激 获得 了 更 长 的 学 习 时 间 , 表明 个 体会 优先 对 高 价值 项 
目 分 配 认 知 资源 ( 姜 英 杰 等 , 2016). 瞳孔 扩张 也 与 认 知 资源 投入 有 关 , 学 习 者 编码 信息 的 心 
理 努 力 更 大 时 《此 时 认 知 资源 投入 更 多 )， 瞳 孔 扩张 会 增 大 ， 记 忆 效 果 提高 (Ariel & Castel, 
2014)。 因 此 本 研究 采用 眼 动 追踪 技术 ， 通 过 注视 时 间 和 瞳孔 直径 变化 两 个 指标 ， 考 察 RPE 


影响 项 目 和 联结 记忆 编码 的 元 记忆 控制 过 程 ， 作 为 RPE 效应 产生 的 认 知 机 制 。 
因此 ， 本 研究 通过 3 个 实验 考察 RPE 的 效 价 和 凸显 性 对 同时 呈现 的 项 目 记 忆 和 联结 记 
忆 的 影响 及 其 元 记忆 机 制 。 其 中 实验 1 比较 了 不 同 RPE 水 平 下 项 目 和 联结 记忆 成 绩 的 差异 ， 


并 通过 信心 判断 考察 了 RPE 对 提取 阶段 元 记忆 监测 的 影响 ， 基 于 Rouhani 等 (2020) 的 结果 ， 


实验 1 假设 项 目 和 联结 记忆 受 RPE 影响 的 方向 相反 ， 且 RPE 能 够 促进 记忆 提取 中 的 信心 判 


rr 断 准 确 性 。 在 实验 1 的 基础 上 ， 实 验 2 通过 眼 动 技术 考察 编码 阶段 中 RPE 如 何 影响 元 记忆 
控制 过 程 , 我 们 预期 , 项 目 编码 和 联结 编码 存在 认 知 资源 竞争 ，RPE 对 二 者 的 影响 方向 与 记 
忆 成 绩 的 结果 相符 。 在 实验 1 和 2 中 ， 奖 赏 结果 只 有 1、4 和 7 三 个 水 平 ，RPE 正 负 效 价 分 


别 与 7 和 1 两 种 结果 存在 较 大 的 重合 ， 为 减 小 RPE 效 价 和 奖 党 结果 影响 的 重合 ， 增 加 结果 


的 可 重复 性 , 补充 进行 实验 3, 在 实验 1 的 基础 上 增加 RPE 水 平 , 验证 记忆 中 的 RPE 效应 ， 
预期 其 结果 会 与 前 两 个 实验 一 致 。 


2 实验 1 奖赏 预测 误差 对 项 目 和 联结 记忆 成 绩 的 影响 


实验 1 的 目的 是 考察 RPE 效 价 和 凸显 性 如 何 影 响 项 目 和 奖赏 联结 记忆 。 


2.1 方法 
2.1.1 被 试 


招募 被 试 36 A, IER SIE 2 名 (项 目 记忆 成 绩 低 于 随机 水 平 )， 保 留 被 试 34 人 《女性 


24 人 )， 年 龄 19-25 3 (M=22.11 岁 ，SD=1.98 岁 )， 视 力 或 矫正 视力 正常 ， 无 神经 系统 和 心 
理 疾 病 病史 。 所 有 被 试 均 自 愿 参加 实验 ， 并 签署 被 试 知情 同意 书 。 每 名 被 试 获得 真实 现金 奖 
励 平 均 约 为 21 元 。 

2.1.2 实验 材料 


刺激 材料 为 120 张 室内 和 户外 场景 图 片 (Hoeltje & Mecklinger, 2020)， 整 个 实验 过 程 中 的 


刺激 均 呈 现在 白色 背景 上 。 通 过 E-prime 3.0 进行 实验 编程 。 
考虑 到 个 体 对 奖赏 加 工 的 差异 能 够 调节 RPE 效 价 对 记忆 的 影响 (Aberg et al., 2017; 
Rouhani & Niv, 2019)， 在 学 习 和 测试 的 间隔 时 间 内 ， 让 被 试 填写 汉化 版 的 奖惩 敏感 性 量 表 


(sensitivity to punishment and sensitivity to reward questionnaire, SPSRQ). SPSRQ 包 插 惩罚 敏 
感性 (SP) 和 奖励 敏感 性 (SR) 两 个 分 量 表 , 要 求 被 试 做 出 “是 ”或 “ 否 ” 的 回答 。 汉化 版 SPSRQ Hi 
郭 勇 香 等 (2011) 进 行 修订 ， 共 31 道 题目 ， 其 中 SP 有 19 个 项 目 ，SR 有 12 个 项 目 。 修 订 后 


SPSRQ 中 SP 和 SR 在 本 研究 中 的 内 部 一 致 性 信和 度 分 别 为 0.85 和 0.70。 


2.1.3 实验 设计 
采用 被 试 内 设计 ， 自 变量 为 RPE 效 价 和 凸显 性 ， 因 变量 为 项 目 和 联结 记忆 成 绩 。 
实验 1 中 奖赏 结果 包含 1、4 和 7 三 种 分 值 ， 它 们 在 高 、 低 价值 图 片 中 的 比例 分 别 是 2: 
3:5 和 5: 3: 2。 由 奖赏 结果 和 被 试 的 给 出 的 猜测 价值 之 差 产 生 RPE， 共 有 -6、-3、0、3 和 6 


五 种 分 值 ， 效 价 为 其 正 负 符号 ， 凸 显 性 为 URPE. 


2.1.4 实验 流程 

包含 价值 学 习 和 记忆 测试 两 个 阶段 ， 总 体 流程 如 图 1。 参 考 Rouhani 等 (2018) 的 实验 范 
式 , 价值 学 习 阶 段 以 室内 和 户外 风景 图 片 为 学 习 材 料 , 其 中 一 类 图 片 出 现 高 分 值 结果 的 概率 
更 大 。 在 学 习 阶段 , 让 被 斌 对 图 片 进 行 奖赏 预测 并 获得 奖赏 结果 的 反馈 ， 通 过 这 样 的 强化 学 
习 探 索 图 片 分 值 规律 , 所 有 分 值 的 30% 将 累计 入 总 分 值 中 ; 告知 被 试 之 后 有 在 每 两 张 图 片 中 
进行 决策 并 获得 其 价值 的 机 会 ， 以 此 产生 奖赏 动机 对 记忆 的 影响 , 但 实际 的 程序 并 不 包括 决 
策 阶 段 ,学 习 阶 段 后 直接 对 被 试 进行 项 目 和 奖赏 联结 记忆 测试 ,并 给 出 对 其 回忆 结果 的 信心 


判断 (judgements of confidence, JOCs)。 
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图 1 实验 1 流程 图 


学 习 阶段 。 在 400~600ms 的 注视 点 后 ,屏幕 上 呈现 一 张 室 内 或 户外 场景 图 片 3 秒 , 这 3 
秒 之 内 不 需 按键 ,图 片 消失 后 , 进入 价值 猜测 , 电脑 询问 被 试 “你 猜测 这 张 图 片 分 值 为 多 少 ? ” 
并 给 出 可 选项 为 1、4 或 7 分 (分 别 对 应 左 、 下 、 右 方向 键 )， 要 求 在 3 秒 内 按键 作答 。 随 后 询 
问 被 试 对 于 猜测 的 信心 判断 值 , 并 按 z x c 或 v 键 进行 反应 (分 别 对 应 “ 猜 的 "“ 有 点 确定 ”、 
“相当 确定 ”或 “完全 确定 ”), 要 求 在 3 秒 内 按键 反应 。 按键 之 后 ,屏幕 上 再 次 呈现 图 片 及 其 价 
值 结果 (如 “+7”), 呈现 3 秒 。 正 式 实验 包括 60 个 试 次 , 在 此 之 前 , 被 试 需要 完成 6 个 练习 试 
次 ， 以 确保 完全 理解 指导 语 。 

学 习 阶段 之 后 ， 要 求 被 斌 填写 汉化 版 的 SPSRQ， 然 后 进行 连续 减 3 的 干扰 任务 ， 以 填 
充 学 习 和 测试 间 的 5 分 钟 间隔 。 

最 后 进入 未 被 提前 告知 的 测试 阶段 。 首 先 呈 现 一 个 400~600ms 的 注视 点 ， 随 后 呈现 一 
张 场景 图 片 ， 图 片 下 方 出 现 新 旧 两 个 选项 ， 被 试 需要 在 5 秒 内 按 左 右 方 向 键 进 行 反 应 ， 并 在 
之 后 的 3 秒 内 按 Z. x. c v 键 做 出 信心 判断 ( 猜 的 、 有 点 确定 、 相 当 确 定 或 完全 确定 )。 然 
后 进入 价值 回忆 ， 屏 幕 上 再 次 呈现 该 场景 图 片 ， 图 片 下 方 出 现 1、4 和 7 三 个 价值 选项 ， 被 
试 需要 在 5 秒 内 按 方向 键 作答 ， 并 在 之 后 的 3 秒 内 给 出 信心 值 ( 猜 的 、 有 点 确定 、 相 当 确 定 
或 完全 确定 )。 回 忆 阶 段 的 正式 实验 包含 60 张 旧 图 像 和 60 张 新 图 像 ， 在 此 之 前 ， 被 试 需要 
完成 12 个 试 次 的 练习 。 
2.1.5 数据 整理 与 分 析 方 法 

项 目 记忆 成 绩 为 对 旧 图 片 的 再 认 结果 (正确 计 分 为 1， 错 误 计 分 为 0)， 联 结 记 忆 成 绩 为 
项 目 再 认 正 确 试 次 中 被 试 对 价值 反馈 的 回忆 结果 (正确 计 分 为 1， 错 误 计 分 为 0)，JOCs 中 
猜 的 、 有 点 确定 、 相 当 确 定 、 完 全 确定 分 别 记分 为 1、2、3、4。 对 于 SPSRQ 分 数 ， 首 先 将 


SR 分 数 和 SP 分 数 转换 为 z 值 ， 再 将 二 者 相 减 得 到 奖惩 敏感 性 差 值 分 数 。 
5 


参考 前 人 的 分 析 方 法 (Rouhani et al., 2018), 通过 R 软件 的 广义 混合 效应 线性 模型 对 行为 
数据 进行 分 析 ， 始 终 将 被 试 作为 随机 截 距 项 放 入 所 有 模型 分 析 。 以 往 多 数 研究 只 将 RPE 作 


为 预测 因子 ， 忽 略 了 奖赏 结果 本 身 的 影响 (Ergo et al., 2020; Jang et al., 2019; Rouhani et al., 


2018), 但 奖赏 结果 和 RPE 两 种 奖赏 成 分 都 可 能 影响 情景 记忆 ， 且 RPE 正 效 价 往往 对 应 着 高 
奖 党 结果， 两 种 效应 存在 混淆 ， 因 此 本 研究 将 同时 对 这 两 种 奖赏 成 分 进行 分 析 ， 在 考察 RPE 
和 URPE 的 影响 时 ， 始 终 将 奖赏 结果 作为 另 一 预测 因子 放 入 模型 。 若 因 变量 为 分 类 变量 ( 即 
项 目 记忆 和 联结 记忆 准确 性 )， 使 用 广义 混合 效应 线性 模型 (lme4 包 中 的 glmer 函数 ) 进 行 分 
Wr. 若 因 变 量 为 连续 变量 ( 即 项 目 记忆 和 联结 记忆 JOCs)， 使 用 混合 效应 线性 模型 (nlme 包 中 
的 Ime 函数 ) 进 行 分 析 。 当 对 多 个 因子 的 影响 进行 分 析 时 ,报告 拟 合 程度 最 好 ( 即 AIC 值 最 低 ) 
的 公式 中 的 效应 ， 如 某 些 情况 下 ， 考 虑 进 因子 间 显 著 的 交互 作用 后 ，AIC 值 更 低 ， 则 同时 报 
告 因子 的 主 效 应 及 其 交互 作用 ,在 线性 模型 分 析 结果 中 ,RPE 的 主 效应 显著 则 表明 存在 RPE 
效 价 效应 ，URPE 的 主 效应 显著 则 表明 存在 凸显 性 效应 。 对 于 交互 作用 ， 通 过 将 主 效 应 项 b 
S 值 乘积 的 符号 与 交互 作用 项 b 值 的 符号 进行 对 比 ， 符 号 相反 时 的 交互 作用 被 描述 为 负 向 交 
= 互 作用 ,此 时 一 个 变量 的 增长 会 削弱 另 一 个 变量 的 效应 量 ; 符号 相同 时 则 被 描述 为 正 向 交互 
co 作用 ， 此 时 一 个 变量 的 增长 会 增 大 另 一 个 变量 的 效应 量 。 
= 22 结果 分 析 
R 2.2.1 奖赏 预测 误差 对 情景 记忆 成 绩 的 影响 

出 去 学 习 阶段 中 被 试 未 做 出 价值 猜测 按键 的 试 次 后 ， 不 同 RPE 条 件 下 ， 项 目 和 联结 记 
忆 击 中 率 的 均值 和 标准 差 如 表 1 所 示 ，RPE 和 奖赏 结果 对 记忆 成 绩 的 影响 如 图 2 所 示 。 

表 1 实验 1 项 目 和 联结 记忆 击 中 率 均值 和 标准 差 (n = 34) 


| 
H 


RPE -6 3 0 3 6 


项 目 记忆 ”0.73(0.21) 0.73(0.16) 0.71(0.13) 0.75(0.17) 0.79(0.25) 


联结 记忆 0.32(0.32) 0.43(0.17) 0.62(0.13) 0.43(0.18) 0.42(0.36) 


a. RPE 对 项 目 和 联结 记忆 的 影响 b. 奖赏 结果 对 项 目 和 联结 记忆 的 影响 
10 
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42 实验 1 奖赏 (a 为 RPE，b 为 奖赏 结果 ) 对 项 目 和 联结 记忆 击 中 率 的 影响 (误差 线 为 标准 误 ) 
0 


对 记忆 成 绩 进行 分 析 ( 表 2) 发 现 ， 奖 赏 结果 (p= 0.610) 4 RPE = 0.217) XT 


响 不 显著 , URPE(p =0.070) 的 影响 也 只 达 
大 而 提高 的 趋势 。 对 于 联结 记忆 ， 


大 到 了 


高 奖赏 结果 和 RPE I 
表明 随 着 奖 
0.001)， 联 结 记 忆 成 绩 在 低 凸 显 


=i 
IEJ 


r yE 
"5s 


(p — 0.001), 


IE] o 


对 再 认 正 确 试 次 的 反应 时 3 


硕 目 记忆 的 影 


边缘 显著 水 平 , 表明 项 目 


奖赏 结果 (p= 0.002) Fl RPE(p<0.001) 主 效应 均 显著 ,表明 


记忆 只 有 随 凸 显 性 增 
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E 效 价 都 会 促进 联结 记忆 成 绩 的 提高 ， 且 两 者 存在 显著 的 负 向 交互 作用 
果 的 增 大 ，RPE 效 价 的 效应 会 减弱 ，URPE 的 影响 也 显著 < 
性 时 更 高 
行 分 析 ( 表 3)， 结 果 只 发 现 了 奖赏 结果 的 增 大 对 联结 记忆 提 


取 速 度 的 显著 促进 作用 (p= 0.002). 

将 正 负 RPE 效 价 间 的 项 目 记忆 和 联结 记忆 成 绩 分 别 作 差 ， 再 将 该 差 值 与 奖惩 敏感 性 差 
值 进行 相关 分 析 。 结果 发 现 , 奖惩 敏感 性 差 值 与 项 目 记忆 成 绩 差 值 的 相关 并 不 显著 (r= -0.25, 
p=0.147)， 但 与 联结 记忆 成 绩 差 值 的 相关 显著 (r= 0.39，p=0.022)， 对 奖赏 更 敏感 同时 对 惩 
罚 更 不 敏感 的 被 试 ， 在 RPE 正 效 价 时 的 联结 记忆 成 绩 会 更 高 于 负 效 价 时 。 

表 2 实验 1 项 目 和 联结 记忆 击 中 率 广义 混合 线性 模型 分 析 结 
项 目 记忆 击 中 率 联结 记忆 击 中 率 
变量 
b z p 9595 CI b z p 95% CI 
intercept 1.11 718 — «0.001 [0.34, 0.68] 0.17 -1.21 0.227 [-0.46, 0.11] 
RPE 0.03 1.23 0.217 -0.02, 0.07] 0.14 3.54 «0.001 [0.06, 0.22] 

奖赏 结果 -0.02 -0.51 0.610 [-0.07, 0.04] 0.09 3.15 0.002 [0.04, 0.15] 

AE HE 0.04 5.03 0.001 [-0.06, -0.02] 

intercept 0.89 0.64 — «0.001 0.60, 1.17] 0.12 0.96 0.335 [-0.12, 0.36] 

URPE 0.05 1.81 0.070 -0.00, 0.09] 0.19 7:13 <0.001 [-0.24, -0.13] 

奖赏 结果 0.01 0.64 0.525 -0.03, 0.05] 0.08 3.54 <0.001 [0.03, 0.12] 

表 3 实验 1 项 目 和 联结 记忆 反应 时 广义 混合 线性 模型 分 析 结 
项 目 记忆 反应 时 (ms) 联结 记忆 反应 时 (ms) 
变量 
B b t p 95% CI b t p 95% CI 
intercept 1914.56 28.84 «0.001 [1784.32, 2044,79] 1949.60 19.03 «0.001  [1748.41, 2150,78] 
RPE 8.23 -0.98 0.327 [-7,80, 24.24] 2.13 0.16 — 0.874 [-23.83, 28.99] 

奖赏 结果 -10.23 -1.01 0.314 [-30.67, 10.22] -49.95 | -3.18 0.002 [-80.55, -18.77] 

intercept 1856.27 29.24 «0.001  [1731.749, 1980,79] 1916.96 19.47 «0.001  [1723.65, 2110.28] 

URPE 10.77 1.21 0.228 [-6.74, 28.27] 11.51 0.80 0.426 [-16.88, 39.91] 

奖赏 结果 -2.44 0.32 0.746 [-17.26, 12.37] -47.31 -3.86 0.003 [-71.37, 23.24] 


2.2.2. 奖赏 预测 误差 对 信心 判断 的 影响 


删 去 一 名 未 到 
阶段 没有 做 出 价值 预期 以 及 在 六 


i 
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LE 解 信心 判断 指导 语 的 被 试 (全 部 选择 了 完全 确 
式 阶段 未 做 出 信心 类 


(2, i> » 


选 ] 


I 断 的 试 次 后 ， 在 不 同 RP 
同 记忆 结果 下 中 项 目 记 忆 和 联结 记忆 JOCs 的 均值 和 标准 差 如 表 4 所 示 , 错误 和 1 


硕 )， 并 删 去 被 试 在 学 习 
Fh, 不 
忆 试 


E af 


E 确 


H 


次 中 RPE 对 JOCs 的 影响 如 图 3 所 示 。 
#4 项 目 和 联结 记忆 JOCs 均值 和 标准 差 (n = 33) 


RPE -6 -3 0 3 6 


认 正 确 3.07(0.81) 3.00(0.93) 3.02(0.82) 2.99(0.80) 3.21(0.65) 


项 目 记 忆 JOC 


再 认错 误 2.57(0.75) 2.31(0.77) 2.45(0.6) 2.21(0.73) 2.53(0.91) 


可 忆 正 确 2.35(0.87) 2.49(0.66) 2.75(0.55) 2.81(0.70) 3.14(0.85) 


联结 记忆 JOC 


回忆 错误 2.64(0.81) 2.54(0.58) 2.38(0.52) 2.40(0.58) 2.45(0.69) 


a. RPE 对 项 目 记 忆 JOCs 的 影响 b. RPE 对 联结 记忆 JOCs 的 影响 
4 正确 4 正确 
secs 错误 一 ------- 错误 
ai by 
3 下 一下- 下- T 3 T 
3 tT 
Q T. T Q T. F 
g MILL or 9 证 T 
HN, N 
na 三 2 
n Xu 
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RPE RPE 


图 3 实验 1 RPE 对 项 目 (图 a) 和 联结 记忆 (图 b)JOCs 的 影响 (误差 线 为 标准 误 ) 


对 于 项 目 记 忆 JOCs， 首 先 ， 项 目 记 忆 结 果 的 影响 显著 (b = 0.76, t= 17.48, p<0.001, 


95% CI =[0.68, 0.85])， 再 认 正 确 时 的 信心 值 比 再 认错 误 时 更 高 。 值 得 注意 的 是 ， 这 种 记忆 结 


果 的 主 效 应 体现 的 是 JOCs 的 准确 性 ， 若 其 他 变量 和 记忆 结果 有 显著 的 交互 作用 ， 则 表明 该 


变量 能 够 影响 JOCs 准确 性 。 在 将 记忆 结果 作为 预测 因子 的 基础 上 , 分 别 对 RPE 和 URPE Xt 
行 混合 线性 回归 分 析 ( 表 5)。 结 果 发 现 ， 三 个 奖赏 成 分 与 记忆 结果 的 交互 作用 都 不 显著 (ps > 


0.010)。 


对 于 联结 记忆 JOCs， 联 结 记 忆 结 果 的 影响 同样 显著 (b=0.26, t=5.47, p<0.001, 95% 
CI=[0.16, 0.35])， 当 联结 回忆 正确 时 , 被 试 的 信心 判断 值 更 高 。 在 将 回忆 结果 作为 预测 因子 
的 基础 上 ， 再 分 别 对 RPE 和 URPE 的 影响 进行 混合 线性 回归 分 析 ( 表 5)。 结 果 发 现 ， 奖 赏 结 
果 (p = 0.005) 和 RPE(p = 0.029) 分 别 与 记忆 结果 的 正 向 交互 作用 显著 ， 表 明 奖 赏 结果 和 RPE 
效 价 对 联结 记忆 JOCs 准确 性 存在 显著 影响 , 奖赏 结果 升 高 和 RPE 正 效 价 都 促进 了 联结 JOCs 


准确 性 的 提高 。 但 URPE 与 记忆 结果 交互 作用 不 显著 (p = 0.817)。 
表 5 实验 1 JOCs 混合 线性 模型 分 析 结果 


项 目 记忆 JOCs 联结 记忆 JOCs 
变量 
b t p 95% CI b t p 95% CI 
intercept 2.4/7 29.91 «0.00  [2.31,2.63] 2.46 28.01 «0.0001 [2.29.2.64] 
记忆 结果 0.70 — 29.9] <0.001  [0.57,0.83] 0.05 0.52 0,602 [0.12,0.22] 
RPEx 记 忆 结果 -0.01 -0.76 — 0.448 [-0.03, 0.01] 0.03 2.19 0.029 [0.00, 0.06] 
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奖赏 结果 x 记忆 结果 (0.02 1.20 0.230 [-0.01, 0.04] 0.05 2.79 0.005 [0.01, 0.08] 

Intercept 2.47 29.96 «0.001 [2.31, 2.63] 2.46 27.80 «0.001 [2.29, 2.64] 

记忆 结果 0.71 11.34 «0.001 [0.00, 0.09] -0.05 -0.58 0.564 [-0.21, 0.11] 

URPEx iu £i 0.01 0.62 . 0.534 [-0.01, 0.03] 0.00 -0.23 0.817 [-0.04, 0.03] 

奖赏 结果 x 记忆 结果 0.01 0.96 0.335 [-0.01, 0.03] 0.07 5.36 <0.001 [0.05, 0.10] 
2.3 讨论 

实验 1 中 ， 不 同 奖赏 条 件 下 的 项 目 记忆 成 绩 相 似 ， 只 存在 项 目 记忆 随 RPE 凸显 性 升 高 
而 增 大 的 趋势 。 这 可 能 是 由 于 预期 阶段 时 长 为 3s， 导 致 被 试 在 预期 阶段 就 已 对 图 片 进行 了 


较 深 编码 ， 而 在 反馈 阶段 更 多 地 编码 
忆 编 码 的 影响 。 但 


前 人 使 月 


的 显著 影响 ， 究 其 原因 ， 前 人 研究 中 乡 


4 和 7 三 个 分 值 选 项 ， 奖 赏 信息 加 了 


加 工 。 


不 同 的 是 , 考虑 了 奖赏 结果 增 大 对 
中 明显 的 RPE 正 效 价 和 低 凸 显 性 优势 。 此 外 ,个 体 特 质 可 能 会 通过 
改变 记忆 成 绩 (Aberg et al., 2017; Rouhani & Niv, 2019)， 奖 惩 敏感 性 差 
比 于 受奖 赏 动机 的 激励 更 弱 的 人 ， 
会 更 高 。 
反应 时 反映 了 记忆 提取 的 流畅 性 ，JOCs 反映 了 记忆 提取 中 的 元 记忆 监测 准确 1 


结 记忆 成 绩 


受奖 党 动机 的 激励 更 强 的 个 体 在 面 对 RPE 正 效 价 时 ， 联 


联结 信息 ， 从 而 削弱 了 反馈 阶段 产生 的 RPE 对 项 目 记 


相似 程序 (Rouhani & Niv, 2021)， 却 仍 发 现 了 URPE 对 项 目 记忆 
分 值 为 1 至 100 间 的 连续 整数 列 ， 而 本 研究 只 包含 
[对 认 知 资源 的 占用 更 小 ， 有 利于 个 体 更 充分 对 图 片 进行 


联结 记忆 成 绩 的 促进 效应 后 ， 


我 们 仍 发 现 了 联结 记忆 
过 影响 奖赏 的 动机 作用 而 
直 的 分 析 结果 表明 ， 相 


下 


对 联结 记忆 的 提取 过 程 有 重要 影响 , 一 方面 ,奖赏 结果 的 增 大 提高 了 联结 记忆 提取 的 流畅 性 ， 
另 一 方面 ， 联 结 记忆 提取 中 的 元 记忆 监测 在 高 奖赏 结果 和 RPE 正 效 价 时 更 准确 ， 且 RPE IE 
效 价 时 准确 性 也 更 高 。 
3 实验 2 奖赏 预测 误差 对 项 目 和 联结 编码 中 眼 动 的 影响 

在 实验 1 的 基础 上 ， 实 验 2 采用 眼 动 技术 ， 考 察 RPE 效 价 和 凸显 性 对 项 目 和 联结 记忆 


编码 过 程 中 元 记忆 控 
此 实验 2 中 将 学 习 阶 段 的 预期 阶段 时 间 由 3s 变 为 28， 相 应 地 将 反馈 阶段 时 间 由 3s 延长 到 


出 的 影响 。 实 验 1 i 


过 长 的 预期 阶段 导致 了 项 目 记忆 成 绩 的 阴性 结果 ， 基 


4s， 以 增强 反馈 阶段 的 奖赏 信息 对 记忆 的 影响 。 


3.1 方法 
3.1.1 被 试 


考虑 到 眼 动 分 析 中 会 剔除 部 


分 记录 失误 的 试 次， 实验 2 将 学 习 阶 段 的 试 次 数 由 60 增加 
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到 100， 相 应 减 小 了 被 试 量 。 共 招募 被 试 23 人 ， 其 中 女性 17 A, 年 龄 为 17~23 2 (M7 19.79 
岁 ，SD= 1.89 岁 )， 视 力 或 矫正 视力 正常 ， 无 神经 系统 和 心理 疾病 病史 。 所 有 被 试 均 自愿 参 
加 实验 ， 并 签署 被 试 知情 同意 书 。 每 名 被 试 获得 真实 现金 奖励 平均 约 为 28 元 。 
3.1.2 实验 材料 与 仪器 
刺激 材料 和 量 表 与 实验 1 中 相同 。 采 用 Eyelink1000Plus 塔 式 眼 动 仪 ,采样 率 为 1000Hz。 
屏幕 刷新 率 为 60Hz， 分 辨 率 为 1920x1080 像素 ， 被 试 眼 睛 与 屏幕 间距 离 为 7ccm， 所 有 刺激 
都 呈现 在 深 灰 色 背 景 上 ， 图 片 大 小 为 600x400 像素 ， 记 录 右 眼 的 眼 动 轨迹 。 
3.1.3 实验 流程 

实验 流程 (图 4) 和 指导 语 与 实验 1 相似 。 不 同 的 是 ， 调 整 学 习 阶段 各 屏 的 呈现 时 间 ， 
预期 阶段 图 片 仅 呈现 2 W, 而 反馈 阶段 图 片 呈现 时 长 改 为 4 秒 , 且 除 了 每 个 试 次 开始 时 的 注 
视点 外 ， 每 两 屏 间 都 还 有 一 个 600~800ms 的 注视 点 空 屏 ， 试 次 结束 后 还 有 一 个 800~1200ms 
的 注视 点 空 屏 。 学 习 阶 段 包 括 100 试 次 , 测试 阶段 包括 200 试 次 。 完 成 练习 试 次 后 ， 先 进行 
九 点 模式 校准 ， 要 求 平 均 误差 低 于 0.3"， 成 功 校 准 后 ， 实 验 开始 。 

在 学 习 阶 段 的 价值 反馈 屏 收集 眼 动 数据 。 一 方面 ， 以 图 片 和 分 值 区 域 为 兴趣 区 , 分 别 收 
集 被 试 的 注视 时 间 ; 男 一 方面 ， 记 录 该 屏 内 被 试 的 瞳孔 直径 。 


TN 


0. 6~0. 8s 5s 


n 


图 4 实验 2 流程 图 (在 价值 反馈 屏 收集 眼 动 指标 ， 流 程 图 


ph 以 绿色 框 标 出 ) 


3.2 结果 分 析 
3.2.1 奖赏 预测 误差 对 情景 记忆 成 绩 的 影响 
删 去 学 习 阶 段 被 试 没 有 做 出 价值 猜测 的 试 次 后 ， 不 同 RPE 条 件 下 ， 项 目 和 联结 记忆 击 
中 率 的 均值 和 标准 差 如 表 6 所 示 ，RPE 和 奖赏 结果 对 记忆 击 中 率 的 影响 如 图 5 所 示 。 
表 6 实验 2 项 目 和 联结 记忆 击 中 率 均值 和 标准 差 (n = 23) 


RPE -6 -3 0 3 6 


项 目 记忆 ”0.85(0.11) 0.75(0.16) 0.74(0.13) 0.78(0.17) 0.81(0.18) 


联结 记忆 0.33(0.21) 0.31(0.14) 0.51(0.14) 0.38(0.18) 0.43(0.21) 


a. RPE 对 项 目 和 联结 记忆 的 影响 


b. 奖赏 结果 对 项 目 和 联结 记忆 的 影响 
1.0 i 10 
" 口 项 Be gt: 
— 联结 iH mp 
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0.8 T qo ` 0.8 工 = 
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图 5 实验 2 奖赏 (a RPE, b 为 奖赏 结果 为 右 ) 对 项 目 和 联结 记忆 击 中 率 的 影响 (误差 线 为 标准 误 ) 


对 记忆 成 绩 进行 分 析 ( 表 7)。 对 于 项 目 记忆 , 首先 , 奖赏 结果 (p<0.001) 和 RPE(p<0.001) 
主 效应 均 显 著 ， 且 两 者 存在 显著 的 负 向 交互 作用 (p= 0.002)， 高 奖赏 结果 和 RPE 负 效 价 都 促 
进 了 项 目 记忆 的 提高 ， 但 效 价 效 应 会 随 着 奖赏 结果 的 增 大 而 被 削弱 。 其 次 ，URPE 的 影响 也 
显著 (p< 0.001), 项 目 记 忆 成 绩 随 RPE 凸显 性 增高 而 提高 。 联 结 记 忆 成 绩 的 结果 与 实验 1 相 


ys 


同 ， 奖 赏 结果 (p <0.001), RPE(p = 0.002) 和 URPE(p < 0.001) 的 影响 均 显著 ， 且 RPE 与 奖赏 
结果 的 负 向 交互 作用 显著 p< 0.001)， 联 结 记 忆 成 绩 受到 高 奖赏 结果 的 促进 ， 且 存在 RPE 1E 
效 价 和 低 凸 显 性 优势 ， 其 中 效 价 效应 会 受 高 奖赏 结果 的 削弱 。 

对 再 认 正 确 试 次 的 反应 时 进行 分 析 ( 表 8)， 只 发 现 了 URPE 对 联结 记忆 反应 时 的 显著 影 
响 (p= 0.011), RPE 凸显 性 的 减 小 促进 了 联结 记忆 提取 速度 的 提高 。 

奖惩 敏感 性 差 值 与 正 负 效 价 间 项 目 记 忆 成 绩 差 值 (x = -0.05, p = 0.840) 和 联结 记忆 成 绩 


差 值 (x=-0.11，p = 0.630) 的 相关 都 不 显著 。 
表 7 实验 2 项 目 和 联结 记忆 击 中 率 广义 混合 线性 模型 分 析 结 


项 目 记忆 击 中 率 联结 记忆 击 中 率 
变量 
b z p 95% CI b z p 9595 CI 
intercept 0.82 4.00 «0.001  [0.53, 1.06] -0.14 -1.03 0.302 [-0.42, 0.13] 
RPE -0.15 -4.16 «0.001  [-0.22, -0.08] 0.10 3.07 0.002. [0.04, 0.17] 
奖赏 结果 0.09 3.38  <0.001 [0.04, 0.15] 0.12 4.25 <0.001 [0.06, 0.17] 
交互 作 0.02 3.04 0.002 [0.01, 0.04] -0.03 -4.06 «0.001  [-0.04, -0.01] 
intercept 0.96 4.99 «0.001  [0.58, 1.35] 0.20 1.60 0.110 [-0.05, 0.44] 
URPE 0.09 3.57 «0.000 [0.04,0.13] -0.18 -7.72 <0.001  [-0.22, -0.13] 
奖赏 结果 0.04 2.11 0.035 [0.00, 0.08] 0.10 5.21 <0.001 [0.06, 0.14] 
表 8 实验 2 项 目 和 联结 记忆 反应 时 广义 混合 线性 模型 分 析 结 果 
"mS 项 目 记忆 反 应 时 ms) 联结 记忆 反应 时 (ms) 
pa 
b t p 95% CI b t p 95% CI 
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intercept 1643.47 


RPE -1.85 
奖赏 结 -12.14 


intercept 1656.91 
URPE -1.98 


奖赏 结果 -14.08 


24.73 <0.001  [1513.13, 1773.81] 898.77 11.10 
-0.31 0.760 [-13.73, 10.03] -4.04 -0.48 
-1.500 0.134 [-28.02, 3.73] -13.23 -1.30 
25.55 <0.001 [1529.73, 1784.09] 854.83 10.84 
-0.299 0.765 [-14.95, 10.99] 23.01 2.55 
-2.423 0.016 [-25.48, -2.68] -14.63  -1.86 


3.2.2 奖赏 预测 误差 对 编码 阶段 眼 动 的 影响 


表 9 实验 2 注视 时 间 (ms) 和 瞳孔 变化 (hm) 的 均值 和 标准 差 (n = 20) 
-3 0 3 6 


RPE 


-6 


图 片 注视 时 间 2660.54(460.5) 


分 值 注视 时 间 506.59(224.34) 
瞳孔 变化 平均 值 -69.78(67.04) 
瞳孔 变化 最 大 值 159.72(57.69) 


删 去 眼 动 数据 收录 过 程 
或 对 分 值 注视 时 间 小 于 50ms 的 试 次 ， 
及 瞳孔 直径 变化 的 混合 2 
考察 RPE 对 图 片 和 分 值 


<0.001 [739.81, 1057.73] 
0.634 [-20.70, 12.62] 
0.195 [-33.26, 6.80] 
«0.001 [700.02, 1009.64] 
0.011 [5.27, 40.76] 
0.063 [-30.08, 0.82] 


2576.9(403.95) 2572.34(356.85) 2686.05(367.19) 2721.83(373.85) 


542.96(212.07)  550.89(246.87) 486. 1(202.6) 437.07(176.77) 
-42.83(62.85) -33.84(48.4) -44.19(69.11) -42.25(82.59) 
174.92(61.73) 176.47(57.2) 180.08(58.26) 210.06(98.49) 


注视 时 间 的 影响 。 结 果 发 现 ,， URPE 对 


校准 失败 的 3 名 被 试 ， 对 于 剩余 20 名 的 被 试 ， 删 去 瞬 眼 过 多 
述 统计 结果 如 表 9 所 示 。 对 图 片 和 分 值 注 视 时 间 以 
性 模型 分 析 结 果 如 下 〔( 见 表 10): 


图 片 注视 时 间 影 响 显著 @p 


= 0.016)，RPE 凸显 性 的 增 大 会 使 图 片 注视 时 间 延 长 。URPE 对 分 值 注视 时 间 也 有 显著 影响 
被 试 对 分 值 的 注视 时 间 越 长 。 奖 赏 结果 和 RPE 对 图 片 注视 
时 间 的 影响 都 不 显著 ， 奖 赏 结果 和 RPE 对 分 值 注视 时 间 的 影响 也 都 不 显著 (ps > 0.010). 


(p=0.006), RPE 凸显 


首先 进行 瞳孔 基线 校正 


性 更 小 时 ， 


过 减法 换算 (瞳孔 变化 值 = 反馈 屏 


值 ( 杨 晓 梦 等 , 2020). 考察 RPE 对 瞳孔 变化 的 影响 , 结果 发 现 , 对 于 
=0.002) 和 URPE(p=0.003) 的 主 效应 显著 ,有 旦 奖赏 结果 和 RPE 有 显著 正 向 交互 作用 (p=0.023)， 
显著 正 向 交互 作用 (p=0.034), 表明 RPE 正 效 价 和 低 凸 显 性 都 促进 了 


同时 奖赏 结果 的 增 大 会 增强 效 价 和 巴 显 性 的 效应 。 对 于 瞳孔 变化 最 


奖赏 结果 和 URPE 也 


In 


章 孔 变化 平均 值 的 增加 ， 


E, XEBUf MEUS ABE 


呈现 前 500ms 的 平均 瞳孔 直径 作为 基线 ， 通 


瞳孔 大 小 一 基线 值 ), 得 到 校正 后 的 瞳孔 变化 平均 值 和 最 大 


Er 


瞳孔 变化 平均 值 , RPE(p 


大 值 ， 奖 赏 结果 (p=0.037)、RPE(p<0.001) 和 URPE(p=0.003) 的 主 效应 显著 ， 且 奖赏 结果 和 
URPE 有 显著 正 向 交互 作用 (p < 0.001)， 表 明 RPE 正 效 价 和 低 凸 显 性 都 促进 了 瞳孔 变化 最 大 


吉 果 的 增 大 会 增强 凸显 性 的 效应 。 
表 10 实验 2 眼 动 结果 的 混合 线性 模型 分 析 结 果 


值 的 增加 ， 同 时 奖赏 


b 
intercept 2607.41 
RPE 8.72 
奖 党 结果 1.98 


妈 片 注视 时 间 (ms) 分 值 注 视 时 间 (ms) 
t p 95% CI b t p 9595 CI 
30.35 «0.001 [2438.91, 2775.92] 528.31 10.53 «0.001  [429.88, 626.74] 
1.46 0.143 [-2.96, 20.41] -5.72  -L50 0.133 [-13.16, 1.74] 
0.25 0.801 [-13.43, 17.39] 2.09  -0.42 0.676 [-11.92, 7.73] 
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intercept 


intercept 


RPE 
奖 党 结果 
交互 作 


intercept 
URPE 

奖赏 结果 

交互 作 


3.3 讨论 


2531.79 29.81 «0.001 [2365.20,2698.39] 851.26 11.77 «0.001  [484.36, 678.15] 
15.66 2.41 0.016 [2.93, 28.39] 11.51 -2.78 | 0.006 [-19.62, -3.39] 
10.81 1.90 0.058 [-0.36, 21.97] 7.95 -2.19 0.029 [-15.06, -0.83] 

瞳孔 变化 平均 值 (pm) 瞳孔 变化 最 大 值 (um) 

b t p 95% CI b t p 95% CI 
25.94 1.84 0.067 [-53.66, 1.79] 192.32 14.50 «0.001  [166.31, 218.33] 
7.06 3.05 0.002 [2.53, 11.60] 4.40 3.63 <0.001 [2.03, 6.78] 
-2.08 1.11 0.266 [-5.74, 1.58] 3.33 -2.08 0.037 [-6.47, -020] 
-1.09 -2.28 | 0.023 [-2.02, -0.15] 

21.52 1.46 0.144 [-50.40, 7.37] 194.58 13.95 «0.001  [167.22, 221.95] 
7.84 2.97 . 0.003 [-13.02, -2.66] 6.67 -2.95 . 0.003 [-11.11, -2.23] 
2.80 1.38 0.169 [-6.79, 1.19] -4.28 -2.45 0.014 [-7.70, -0.86] 
1.18 2.12 0.034 [0.09, 2.28] 1.83 3.82 «0.001 [0.89, 2.77] 


在 缩短 预期 阶段 时 长 ， 并 延长 反馈 阶段 的 呈现 时 间 之 后 ， 实 验 2 发 现 , 项 目 记 忆 中 存在 


RPE 负 效 价 与 高 


并 没有 改变 联结 
性 优势 。 


眼 动 指标 反映 了 元 记忆 控 


( 姜 英 杰 等 ，2016)， 主 要 受到 了 RPE 凸显 性 的 影响 。 当 RPE 凸显 


编码 联结 信息 的 策略 ， 延 长 了 对 分 值 的 学 习 
RPE 凸显 性 增 大 ， 奖 赏 联结 的 编码 人 
瞳孔 直径 变 


RPE 对 瞳孔 变化 


凸显 


制 过 


吉 记 忆 中 的 RPE 效应 ， 实 验 2p 


性 优势 , 与 我 们 的 预期 相符 。 项 


的 影响 会 更 大 。 


的 变化 主要 反映 了 个 体 在 奖赏 动机 作用 (参见 综述 


力 程 度 。 


实验 | 和 2 发 现 了 RPE 效 价 和 凸显 性 对 项 目 
该 影响 发 生 的 认 知 机 制 
资源 投入 。 但 在 这 两 
ffr RPE FARK, 
效 价 本 身 的 效应 ， 
效 价 对 记忆 成 绩 影 响 的 稳定 


Ze v 


个 实验 中 ， 奖 党 


FH 
里 


A, qal 
赏 信息 


结果 只 
然 统 计 分 析 中 始终 考虑 了 奖赏 结果 的 影 听 
目的 是 考察 实验 1 和 2 中 RPE 


通过 


包含 3 


和 次 验证 


了 联结 


性 


记忆 对 价值 反馈 阶段 认 知 资源 的 竞 
吉 记 忆 中 的 RPE TERA 


H 


H 
ME 


程 ,其 中 注视 时 间 反 映 了 个 体 对 不 同 刺 激 的 学 习 时 间 分 配 
更 低 时 ， 
时 间 ， 此 时 对 应 的 联结 记忆 成 绩 也 更 高 。 而 当 
先 级 降低 ， 被 试 对 图 片 的 学 习 时 间 相 应 延长 。 

此 体现 了 被 试 的 心理 努力 程度 (Ariel & Castel, 2014)。 校 了 
值 和 最 大 值 结果 都 表明 ，RPE 正 效 价 和 低 凸 显 性 促进 了 瞳 


被 试 采 取 优先 


FE 后 的 瞳孔 变化 平均 


个 水 平 ， 导 致 高 低 奖赏 


iH 


但 为 增强 该 结果 的 信和 度 ， 补 充 进 行 实验 3, 
性 ， 并 再 次 验证 RPE 凸显 性 的 影响 。 


孔 变 化 ， 同 时 奖赏 结果 更 高 时 ， 

这 与 RPE 对 联结 记忆 的 影响 基本 相符 ， 可 能 表明 瞳孔 直径 
: 杨 晓 梦 等 , 2020) 下 对 分 值 加 工 的 心理 努 

和 联结 记忆 的 分 离 影响 ， 并 进一步 揭示 了 


元 记忆 控制 改变 了 个 体 对 项 目 和 联结 编码 的 认 知 
BRD 
， 已 经 较 准 确 地 体现 了 RPE 


别 与 正 负 效 


4 实验 3 奖赏 预测 误差 对 项 目 和 联结 记忆 成 绩 影响 的 稳定 性 


实验 1 和 2 中 ， 奖 赏 结果 只 有 1、4 和 7 三 种 ， 导 致 高 奖赏 结果 7 对 应 的 RPE 只 有 0 和 
负 效 价 , 低 奖 赏 结果 1 对 应 的 RPE 只 有 0 和 正 效 价 , 只 有 中 等 奖赏 结果 4 同时 对 应 正 效 价 、 
0 和 负 效 价 。 因 此 在 实验 3 中 ， 将 奖赏 结果 设置 为 1、3、5 和 7 四 种 ， 以 增加 RPE KF, w 
和 联结 记忆 影响 的 稳定 


小 RPE 效 价 和 高 低 奖赏 结果 的 重 全 ,验证 RPE 效 价 和 凸显 性 对 项 


4.1 方法 
4.1.1 被 试 
招募 被 试 29 A, BIR 2 名 项 目 记 忆 击 中 率 低 于 0.5 的 被 试 ， 最 后 保留 被 试 27 人 。 其 中 


女性 24 人 ， 年 龄 19~25 岁 (M=22.11 岁 ，SD= 1.98 岁 )， 视 力 或 矫正 视力 正常 ， 无 神经 系统 
和 心理 疾病 病史 。 所 有 被 试 均 自愿 参加 实验 ,并 签署 被 试 知情 同意 书 。 每 名 被 试 获得 真实 现 
金奖 励 平 均 约 为 19 元 。 

4.1.2 实验 材料 

刺激 材料 和 量 表 与 前 两 个 实验 相同 。 

4.1.3 实验 设计 与 流程 

实验 设计 与 实验 1 相似 。 但 在 自 变量 的 操纵 上 ， 奖 赏 结果 序列 变 为 1、3、5 和 7， 它们 
出 现 的 比例 在 高 价值 图 片 中 是 1: 2: 3:4， 而 在 低 价 值 图 片 中 为 4: 3: 2: 1。 由 奖赏 结果 和 被 试 
的 给 出 的 猜测 价值 之 差 产生 RPE 共有 -6、-4、-2、0、2、4 和 6 七 种 。 

总 体 实验 流程 和 指导 语 与 实验 2 相似 。 不同 的 是 ， 首先， 只 保留 了 试 次 开始 时 的 注视 点 
屏 ; 其 次 , 考虑 到 分 值 序列 增加 对 记忆 难度 的 改变 ,将 学 习 阶段 价值 反馈 屏 的 呈现 时 间 延 长 
到 5 秒 。 学 习 阶 段 包括 100 试 次 ， 测 试 阶段 包括 200 试 次 。 

4.2 结果 分 析 

删 去 学 习 阶 段 被 试 没 有 做 出 价值 猜测 按键 的 试 次 后 ， 不 同 RPE 条 件 下 ， 项 目 和 联结 记 

忆 击 中 率 的 均值 和 标准 差 如 表 11 所 示 ，RPE 和 奖赏 结果 对 记忆 击 中 率 的 影响 如 图 6 所 示 。 


表 11 实验 3 项 目 和 联结 记忆 击 中 率 均值 和 标准 差 (n =27) 


RPE -6 4 -2 0 2 4 6 


项 目 记 忆  0.85(0.19) 0.83(0.14) 0.81(0.12) 0.76(0.16) 0.76(0.16) 0.83(0.16) 0.89(0.23) 


联结 记忆 ”0.18(0.27) 0.26(0.19) 0.34(0.12) 0.46(0.11) 0.33(0.12) 0.28(0.21) 0.26(0.29) 


a. RPE 对 项 目 和 联结 记忆 的 影响 


b. 奖赏 结果 对 项 目 和 联结 记忆 的 影响 
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图 6 实验 3 奖赏 (a 为 RPE，b 为 奖赏 结果 ) 对 项 目 和 联结 记忆 击 中 率 的 影响 (误差 线 为 标准 误 ) 


对 记忆 成 绩 进行 分 析 ( 表 12)。 对 于 项 目 记 忆 , 与 实验 2 相同 , 奖赏 结果 (p=0.001)、RPE(p 


< 0.001) 和 URPE(p < 0.001) 的 影响 均 显著 ， 且 RPE RISE 
的 增 大 促进 了 项 目 


的 提高 会 削弱 效 价 效应 。 


0.001)， 奖 赏 结果 


my 


显 性 优势 , 但 奖 
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记忆 成 绩 的 提高 ， 项 
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显著 的 负 向 交互 作 


ip < 


乙 存 在 RPE 负 效 价 优势 以 及 高 
联结 记忆 的 结果 与 前 两 个 实验 相似 , RPE(p 


<0.001) 和 URPE(p < 0.001) 的 影响 均 显著 ， 且 存在 RPE 与 奖赏 结果 显著 的 负 向 交互 作用 人 < 


suk 


0.001), 但 


RPE 正 效 价 和 低 凸 


结果 的 影响 只 达到 了 边缘 
显 性 优势 ， 存 在 随 奖赏 结果 增 大 而 提高 的 趋势 ， 


还 会 受到 高 奖赏 结果 的 削弱 。 


对 再 认 正 确 试 次 的 反应 时 进行 分 析 ( 表 13), RPE = 0.001) 81 URPE(p < 0.001) 对 联结 记 


忆 反 应 时 的 影响 均 显 著 ， 且 奖赏 结果 与 U 
提取 速度 在 RPE 1l 


EI 
NTA 


ERT Bu SH 


奖惩 敏感 性 差 值 与 了 


值 = 0.18，p = 0.370) 的 相关 都 不 显著 。 
#12 实验 3 项 目 和 联结 记忆 击 中 率 广义 混合 线性 模型 分 析 结 果 


变量 


intercept 


E 


PE 
奖赏 结果 
交互 作 


xk 


intercept 


URPE 


0.12 


项 目 记 忆 击 中 率 

z p 
5.61 «0.001 
4.48 «0.001 
3.23 0.001 
3.64 «0.001 
6.31 «0.001 
3.81 «0.001 
2.14 0.032 


FE 更 低 时 加 快 ， 且 奖 


95% CI 
[0.66, 1.39] 
[-0.30, -0.12] 
[0.04, 0.15] 
[0.02, 0.06] 
[0.76, 1.46] 
[0.06, 0.17] 


[0.00, 0.09] 


Me pt 
AH 


-0.05 
0.18 
-0.28 


0.05 


著 水 平 (p=0.056), 表明 联结 记忆 成 绩 存在 稳定 的 


昌 其 中 的 RPE 效 价 效应 


IRPE 的 交互 作用 显著 (p= 0.049)， 表 明 
果 增 大 后 会 削弱 凸显 性 的 效应 。 
E 负 效 价 间 项 目 记忆 成 绩 差 值 (r= 0.02, p = 0.940) 和 联结 记忆 成 绩 


联结 记忆 击 中 率 
Z p 
-1.48 0.14 
5.14 <0.001 
1.91 0.056 
-6.00 <0.001 
1.67 0.095 
-10.23 <0.001 
2.51 0.012 


表 13 实验 3 项 目 和 联结 记忆 反应 时 混合 线性 模型 分 析 结 


项 


t 


记忆 反应 时 (ms) 


p 


95% CI 
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联结 记忆 反应 时 (ms) 


t P 


联结 记忆 的 


9595 CI 
[-0.41, 0.06] 
[0.13, 0.29] 
[-0.00. 0.10] 
[-0.07, -0.03] 
[-0.03, 0.40] 
[-0.33, -0.23] 


[0.01, 0.09] 


9596 CI 


intercept 1704.79 26.76 <0.001 = [1579.85, 1829.74] 1156.36 12.21 «0.001  [970.49, 1342.22] 


RPE -8.22  -L17 0.244 [-22.03, 5.60] -43.81  -3.206 0.001 [-70.18, -17.44] 
奖赏 结果 5.77 0.68 0.500 [-10.83, 22.37] 8.18 0.62 0.533 [-17.54, 33.91] 
intercept 1712.91 27.53 «0.001  [1590.88, 1834.95] 1052.67 10.37 «0.001  [853.47, 1251.86] 
URPE 8.42 1.00 — 0.308 [-7.77, 24.62] 121.04 4.16 «0.001  [64.33, 178.95] 
奖赏 结果 -0.30 -0.05 0.963 [-12.85, 12.25] 4.99 0.34 0.737 [-24.15, 34.13] 
交互 作 -11.83  -197 0.049 [-23.58, -0.07] 
4.3 Wit 


将 RPE 的 水 平 数 增加 到 7 后 ， 正 负 效 价 与 高 低 奖 赏 结果 的 重合 减 小 ， 但 RPE 对 项 目 和 
联结 记忆 成 绩 的 影响 与 实验 1 和 2 中 相同 ， 这 表明 RPE 效 价 和 凸显 性 对 项 目 和 联结 记忆 的 
影响 是 稳定 存在 的 ，RPE 效 价 的 影响 并 非 是 由 奖赏 结果 差异 引起 的 假 阳性 结果 。 

对 于 联结 记忆 提取 过 程 , 实验 1 中 发 现 了 高 奖赏 结果 对 提取 流畅 性 的 促进 ， 而 实验 3 将 
RPE 效 价 与 奖赏 结果 高 低 的 影响 进一步 分 离 后 , 发 现 RPE 正 效 价 时 联结 记忆 提取 速度 更 快 ， 
同时 奖赏 结果 的 影响 不 再 显著 。 这 表明 实验 1 中 的 奖赏 结果 的 影响 可 能 源 自 于 RPE 的 效 价 


效应 。 
实验 2 和 3 中 均 未 发 现 奖惩 敏感 性 与 项 目 和 联结 记忆 中 RPE 效 价 效应 的 相关 ， 且 实验 
1 中 的 相关 程度 偏 低 ， 这 可 能 是 由 于 受 招募 而 来 的 被 试 群体 对 奖惩 的 敏感 性 类 似 。 通 过 将 标 


准 差 除 以 平均 数 计算 离散 系数 , 发 现 被 试 对 奖赏 和 惩罚 的 敏感 性 原始 分 数 的 离散 系数 均 低 于 


0.5 (Kr 1， 奖 赏 : 0.43, Ril: 0.40; 实验 2， 奖 赏 : 0.46， 惩 罚 : 0.29; 实验 3, XE: 
0.15， 惩 罚 : 0.17 )， 离 散 程度 处 于 较 低 水 平 ， 验 证 了 上 述 推论 。 
5 总 讨论 
基于 价值 学 习 -测试 范式 ， 本 研究 通过 3 个 实验 探讨 了 RPE 效 价 和 凸显 性 对 同一 任务 中 
的 项 目 和 联结 记忆 的 不 同 影响 。 实 验 1 发 现 ， 联 结 记 忆 成 绩 存 在 RPE 正 效 价 和 低 凸 显 性 优 
势 ， 其 JOCs 准确 性 在 RPE 正 效 价 时 更 高 。 实 验 2 进一步 发 现 项 目 记 忆 成 绩 存 在 与 联结 记 
忆 相 反 的 RPE 负 效 价 和 高 凸显 性 优势 ， 且 通过 眼 动 技术 考察 记忆 编码 中 的 元 认 知 控制 过 程 
发 现 ，RPE 正 效 价 和 低 凸 显 性 提高 了 个 体 的 瞳孔 变化 平均 值 和 峰值 ， 且 RPE 低 凸 显 性 增加 
了 分 值 注视 时 间 ， 缩 短 了 图 片 注视 时 间 。 实 验 3 增加 了 RPE 水 平 ， 再 次 验证 了 RPE 对 项 目 
和 联结 记忆 的 相反 影响 。 
5.1 奖赏 预测 误差 对 项 目 和 联结 记忆 成 绩 影 响 的 分 离 

RPE 效 价 对 项 目 和 联结 记忆 存在 分 离 的 影响 。 项 目 记 忆 成 绩 中 的 RPE 负 效 价 优势 与 
Wimmer 等 (2014) 的 发 现 一 致 。RPE 正 效 价 能 够 促进 联结 记忆 成 绩 的 提高 ， 与 使 用 词 对 联结 
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(Ergo et al.,2020)、 名 字 - 面 孔 联结 (Calderon etal.,2021D) 和 面孔 -物品 图 像 联 结 (Aberg et al., 2017) 
的 前 人 实验 结果 一 致 ， 体 现 了 联结 记忆 中 RPE 正 效 价 优势 的 类 别 一 般 性 。 
RPE 凸显 性 对 项 目 和 联结 记忆 也 存在 分 离 的 影响 。RPE 高 凸显 性 对 项 目 记 忆 的 促进 作 


用 与 前 人 相同 (Rouhani & Niv, 2019, 2021; Rouhani et al., 2018) 。RPE 高 凸显 性 对 联结 记忆 的 
抑制 作用 也 与 Rouhani 等 (2020) 的 结果 相符 。 而 且 与 前 人 研究 不 同 ， 本 研究 中 的 项 目 -奖赏 联 
结 记忆 涉及 实验 的 主要 任务 , 受到 奖赏 的 直接 影响 , 联结 记忆 中 的 凸显 性 效应 体现 的 是 RPE 
凸显 性 的 直接 影响 。 此 外 ,在 实验 1 中 , 项 目 记 忆 在 不 同 奖赏 条 件 下 的 成 绩 相似 ， 占 用 了 相 
似 的 认 知 资源 ， 而 联结 记忆 的 高 凸显 性 优势 仍然 存在 ， 再 次 表明 RPE 四 显 性 是 直接 作用 于 
联结 记忆 ， 而 非 通过 影响 不 同 凸 显 性 时 项 目 记忆 对 认 知 资源 的 占用 间接 产生 。 
5.2 奖赏 预测 误差 影响 记忆 编码 中 的 元 记忆 控制 
5.2.1 效 价 对 元 记忆 控制 的 影响 
情景 记忆 中 的 奖赏 联结 记忆 (Murtyet al.,2016) 能 够 引导 适应 性 决策 ， 在 认 知 层面 ， 当 面 
对 意味 着 更 高 收益 的 RPE 正 效 价 时 ， 个 体 的 瞳孔 变化 增 大 ， 这 可 能 体现 了 个 体 有 了 更 强 的 
奖赏 动机 后 , 主动 通过 元 记忆 控制 增强 对 联结 记忆 的 认 知 资源 分 配 的 过 程 。 根据 注 意 的 双重 
竞争 模型 (Pessoa, 2009)， 一 方面 ， 奖 赏 相关 刺激 在 视觉 皮层 上 的 表征 得 到 增强 ， 能 够 被 优先 
主意 ; 另 一 方面 , 个 体会 通过 增强 执行 功能 , 促进 奖赏 相关 加 工 的 效率 。 此 外 , 在 生理 层面 ， 
RPE 正 效 价 促使 腹 侧 被 盖 区 的 多 巴 胺 分 泌 增 加 ， 而 负 效 价 时 多 巴 胺 分 泌 减 少 (Schultz et al., 
> 1997)， 这 些 多 巴 胺 传 入 海马 后 能 够 使 瞬时 记忆 痕迹 获得 更 大 的 时 间 持 久 性 ， 从 而 在 联结 记 
- 忆 编 码 时 或 编码 前 后 产生 促进 作用 (Bethus et al., 2010). 
PE 而 RPE 负 效 价 时 ， 对 联结 记忆 的 资源 投入 减少 ， 导 致 此 时 联结 记忆 成 绩 降 低 。 但 对 于 
项 目 记 忆 ， 有 核磁 研究 发 现 ， 在 编码 阶段 ，RPE 负 效 价 虽 然 对 纹 状 体 的 激活 更 弱 , 但 负 效 价 
的 图 片 的 再 认 正 确 率 比 正 效 价 图 片 更 高 ; 且 再 认 成 功 的 图 片 在 编码 中 对 应 的 双 侧 海马 激活 更 
大 (Wimmeretal.,2014)。 这 表明 ，RPE 负 效 价 虽然 诱发 了 更 弱 的 奖赏 动机 ， 却 会 促进 项 目 记 
忆 编 码 ， 从 而 提高 了 项 目 记忆 表现 。 
5.2.2 凸显 性 对 元 记忆 控制 的 影响 
眼 动 结果 表明 ， 凸显 性 对 图 片 和 分 值 编码 时 长 的 影响 是 “此 消 彼 长 ”的 ， 这 一 元 记忆 控 
制 过 程 体现 了 项 目 和 奖赏 联结 对 认 知 资源 的 竞争 ， 也 是 二 者 受 RPE 凸显 性 的 影响 表现 出 分 
离 形 式 的 主要 原因 。RPE 凸显 性 代表 结果 与 预期 的 偏离 程度 的 大 小 , 低 凸 显 性 意味 着 更 少 的 
分 值 信息 更 新 负荷 ， 降低 了 联结 编码 难度 ， 加 工 流畅 性 更 高 。 而 加 工 流畅 性 作为 编码 过 程 元 


记忆 监测 的 内 在 线索 (Koriat, 1997)， 会 促使 被 试 采取 优先 对 联结 信息 分 配 更 多 认 知 资源 的 元 
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记忆 控制 策略 。 一 方面 ， 延 长 对 分 值 的 学 习 时 间 ， 以 加 深 奖 赏 联结 的 记忆 痕迹 ， 另 一 方面 ， 
此 时 瞳孔 变化 增强 ， 表 明了 被 试 增加 了 联结 编码 的 心理 努力 程度 。 

RPE 凸显 性 增 大 后 ， 联 结 记忆 加 工 流 畅 性 降低 ， 奖 赏 联结 的 优先 级 降低 ， 对 图 片 的 认 知 
资源 分 配 相 应 增加 。 在 生理 层面 ， 此 时 被 试 的 意外 程度 更 大 ， 可 能 会 引起 蓝 斑 中 去 甲 皮 上 腺 
素 分 泌 的 增加 , 去 甲 崩 上 腺 素 与 多 巴 胺 在 海马 中 共同 释放 能 够 调节 编码 后 记忆 增强 (Takeuchi 
et al., 2016)， 促 进 了 此 时 的 项 目 记 忆 编 码 。 

5.3 奖赏 预测 误差 影响 联结 提取 中 的 元 记忆 监测 

联结 记忆 提取 过 程 的 元 记忆 监测 准确 性 受到 了 RPE 正 效 价 的 促进 , 流畅 性 受到 RPE IE 
效 价 和 低 凸 显 性 的 促进 。 根据 记忆 再 认 的 双 加 工 理论 , 联结 记忆 提取 需要 检索 特定 项 目的 情 
景 信息 ， 只 能 通过 更 复杂 的 回想 过 程 完成 ， 不 能 像 项 目 记忆 一 样 通过 熟悉 性 过 程 而 快速 地 、 
自动 化 地 完成 再 认 (Woroch & Gonsalves, 2010)。 因 此 编码 阶段 中 的 奖赏 在 提取 阶段 的 效应 主 
要 体现 在 对 回想 过 程 的 促 i 
研究 者 发 现 积极 情绪 刺激 在 编码 阶段 会 被 赋予 更 多 认 知 资源 ， 促 进 对 视觉 细节 的 加 工 ， 
从 而 促进 情景 记忆 的 回想 过 程 ( 毛 新 瑞 等 ,2015)。 而 相 比 于 基于 熟悉 性 做 出 信心 判断 ， 当 个 
体 的 信心 判断 是 基于 回想 时 ， 元 记忆 监测 更 准确 (Souchay et al., 2013)。 由 于 比 预 期 更 高 的 奖 
赏 结果 通常 会 引起 积极 情绪 , 这 可 能 解释 了 奖赏 对 联结 记忆 提取 中 的 元 记忆 监测 产生 促进 作 
用 的 机 制 效 价 通过 在 编码 阶段 中 促进 对 细节 的 加 工 ， 增 强 了 联结 提取 中 的 回想 
过 程 ， 从 而 提高 了 元 记忆 监测 准确 1 
5.4 高 奖赏 结果 同时 促进 项 目 和 联结 记忆 

越 来 越 多 的 研究 者 认为 奖赏 结果 主要 是 通过 RPE 产生 作用 ， 因 而 着 重 探 索 RPE 对 记忆 
的 影响 ， 同 时 忽略 了 奖赏 结果 的 作用 (Ergo et al., 2020; Jang et al., 2019; Rouhani et al., 2018). 
但 本 研究 结果 表明 , 奖赏 结果 在 项 目 和 联结 记忆 中 都 发 挥 着 重要 作用 , 尤其 当 结 果 令 人 足够 
满意 时 ， 结 果 与 预期 剖 优 就 劣 将 不 再 作为 个 体 判 断 其 损益 的 主要 标准 。 

综合 三 个 实验 结果 , 奖赏 结果 的 增 大 同时 促进 了 项 目 记 忆 和 联结 记忆 的 提高 。 奖 赏 结果 
能 够 正 向 促进 情景 记忆 成 绩 ， 这 与 前 人 研究 的 结果 符合 (Castanheira et al.,2021)。 但 Murty 等 
(2016) 发 现 面孔 - 低 奖 赏 联结 的 记忆 成 绩 更 好 , 这 可 能 是 因为 他 们 使 用 具有 社会 性 的 独裁 者 游 
戏 范 式 ， 被 试 采取 “ 避 害 ”的 记忆 策略 。 总 的 来 说 ， 奖 赏 结果 对 记忆 的 影响 具有 “ 趋 利 避 害 ” 
的 适应 性 。 

5.5 不 足 与 展望 


本 研究 考察 了 RPE 效 价 和 凸显 性 如 何 同时 作用 于 项 目 和 联结 记忆 ， 发 现 二 者 在 编码 阶 
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段 中 存在 认 知 资源 竞争 , 被 试 会 以 RPE 效 价 和 凸显 性 为 线索 对 其 


进行 适应 性 的 选择 性 加 工 。 


t 
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操纵 了 学 习 者 的 奖赏 预期 ， 使 其 形成 不 同 的 RPE， 对 记忆 效果 可 能 有 更 多 的 促进 作用 。 


但 值得 注意 的 是 ， 本 研究 选取 的 联结 记忆 指标 为 奖赏 联结 ， 


联结 (Aberg et al., 2017) 以 及 外 语 -母语 词汇 联结 (Calderon et al., 2021; Ergo et al., 2021) 等 存在 


与 前 人 研究 中 的 人 物 - 物 品 


一 个 共同 点 ， 即 RPE 凸显 性 大 小 对 应 了 不 同 的 联结 编码 难度 ， 这 可 能 是 导致 RPE 低 凸 显 性 


时 联结 记忆 成 绩 升 高 的 重要 原因 。 因 此 ， 当 联结 记忆 类 


否 仍 存在 ， 是 未 来 研究 需要 考虑 的 问题 。 


个 体 本 身 的 特质 能 够 影响 奖赏 的 动机 作用 从 而 作 


联结 记忆 (Aberg et al., 2017)， 但 本 研究 只 在 实验 1 中 发 现 了 奖惩 


型 与 凸显 性 


无 关 时 ,凸显 性 的 影响 是 


于 项 目 记 忆 (Rouhani & Niv, 2019) 和 


敏感 性 与 联结 记忆 中 RPE 


效 价 效 应 的 低 相 关 , 这 可 能 是 由 被 试 奖惩 敏感 性 的 低 离 散 程度 导致 的 。 之 后 的 研究 可 以 考虑 
在 实验 前 选取 高 低 敏 感性 两 组 被 试 ， 探 索 其 情景 记忆 受奖 赏 动机 影响 的 差异 。 
此 外 ， 实 验 2 通过 眼 动 技术 对 记忆 编码 过 程 的 学 习 时 间 分 配 和 瞳孔 变化 表征 的 心理 努 


力 程 度 进行 了 考察 ， 发 现 了 编码 项 目 和 联结 信息 的 认 知 资源 分 配 随 RPE 而 变化 。 但 因为 瞳 


孔 直 径 容易 受 物 理 环境 中 的 光 刺 激 影响 ， 而 EEG 研究 能 在 时 间 维 度 更 精细 地 反映 记忆 编码 
过 程 中 的 神经 激活 程度 ， 未 来 的 研究 可 以 通过 分 析 RPE 影响 情景 记忆 的 EEG 时 程 变化 , 进 


一 步 验 证 两 者 的 编码 过 程 受 奖赏 信息 影响 的 差异 。 


6 结论 


RPE 对 项 目 和 联结 记忆 存在 分 离 的 影响 , 元 记忆 过 程 在 其 


Bt, (MAU, RPE 为 线索 进行 元 记忆 控制 , RPE 高 凸显 性 


RPE 正 效 价 和 低 凸 显 性 增加 了 对 联结 编码 的 认 知 资源 投入 ; 在 提取 阶段 ，RPE 正 效 价 还 通 


过 回想 过 程 促进 联结 记忆 提取 的 元 记忆 监测 准确 性 。 
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The distinct effects of reward prediction error on item and 


associative memory: the influence of metamemory 
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Abstract 


Episodic memory consists of item memory and associative memory. Individual cogniti ve resources 
are typically allocated to more valuable information during encoding through metamemory, leading 
to competitive processing of item and associative information. Reward prediction error (RPE), 
defined as the difference between reward results and reward expectations, has two properties: 
valence (positive or negative) and salience (degree of difference). To examine the impact of reward 
prediction error valence and salience on item and associative memory, and how reward prediction 
error influences memory based on metamemory, three experiments were conducted. 

In the learning stage, participants were presented with indoor and outdoor scene pictures. They were 
asked to predict the score of each picture and then received feedback on the actual score. Through 
this reinforcement learning process, participants had to find out which type of pictures is more 
valuable, and 30% of the scores were accumulated into the total score. To induce the effect of reward 
motivation on memory, participants were introduced to the opportunity to choose between two 
pictures and receive the value of the selected picture, although the actual program did not include a 
decision-making stage. After the learning stage, participants were tested on item and reward 
associative memory. 

The findings of the study showed that: (1) There were advantages in associative memory 
performance for positive reward prediction error valence and low salience, with higher accuracy of 
JOCs at positive valence. In contrast, there were advantages in item memory performance for 
negative valence and high salience. (2) In the eye-tracking results during the encoding process, 
positive valence and low salience of reward prediction error resulted in increased mean and peak 
pupil dilation after feedback presentation, as well as longer value fixation duration and shorter 
picture fixation duration at low salience. (3) When the reward prediction error level was increased 
to reduce overlap between reward results and reward prediction error effects, the separation effect 
of reward prediction error on item and associative memory performance remained stable. 

The results of the study suggest that the effects of reward prediction error on item and associative 
memory are distinct. During the encoding stage, individuals use the valence and salience of reward 
prediction error as cues to allocate cognitive resources differently in item and associative memory 
encoding through metamemory control. In the retrieval stage, positive valence of reward prediction 


error enhances the metamemory monitoring level of associative memory retrieval. 
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